Nerf-based Generative models have shown impressive capacity in generating high-quality images with consistent 3D geometry. Despite successful synthesis of fake identity images randomly sampled from latent space, adopting these models for generating face images of real subjects is still a challenging task due to its so-called inversion issue. In this paper, we propose a universal method to surgically fine-tune these NeRF-GAN models in order to achieve high-fidelity animation of real subjects only by a single image. Given the optimized latent code for an out-of-domain real image, we employ 2D loss functions on the rendered image to reduce the identity gap. Furthermore, our method leverages explicit and implicit 3D regularizations using the in-domain neighborhood samples around the optimized latent code to remove geometrical and visual artifacts. Our experiments confirm the effectiveness of our method in realistic, high-fidelity, and 3D consistent animation of real faces on multiple NeRF-GAN models across different datasets.
translated by 谷歌翻译
Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.
translated by 谷歌翻译
Spatial autocorrelation and spatial heterogeneity widely exist in spatial data, which make the traditional machine learning model perform badly. Spatial domain generalization is a spatial extension of domain generalization, which can generalize to unseen spatial domains in continuous 2D space. Specifically, it learns a model under varying data distributions that generalizes to unseen domains. Although tremendous success has been achieved in domain generalization, there exist very few works on spatial domain generalization. The advancement of this area is challenged by: 1) Difficulty in characterizing spatial heterogeneity, and 2) Difficulty in obtaining predictive models for unseen locations without training data. To address these challenges, this paper proposes a generic framework for spatial domain generalization. Specifically, We develop the spatial interpolation graph neural network that handles spatial data as a graph and learns the spatial embedding on each node and their relationships. The spatial interpolation graph neural network infers the spatial embedding of an unseen location during the test phase. Then the spatial embedding of the target location is used to decode the parameters of the downstream-task model directly on the target location. Finally, extensive experiments on thirteen real-world datasets demonstrate the proposed method's strength.
translated by 谷歌翻译
事件提取是医学文本处理的重要工作。根据医学文本注释的复杂特征,我们使用端到端事件提取模型来增强事件的输出格式信息。通过预训练和微调,我们可以提取医学文本四个维度的属性:解剖位置,主题单词,描述单词和发生状态。在测试集中,准确率为0.4511,召回率为0.3928,F1值为0.42。该模型的方法很简单,并且在第七届中国健康信息处理会议(CHIP2021)的中国电子医疗记录中赢得了挖掘临床发现事件(任务2)的任务中的第二名。
translated by 谷歌翻译
新兴的六代(6G)是异质无线网络的集成,它们可以在任何地方和任何时间网络中无缝支持。但是,6G应提供高质量的信任,以满足移动用户的期望。人工智能(AI)被认为是6G中最重要的组成部分之一。然后,基于AI的信任管理是提供可信赖和可靠的服务的有希望的范式。在本文中,为6G无线网络提供了一种生成的对抗性学习信任管理方法。首先审查了一些基于AI的典型信任管理方案,然后引入了潜在的异质和智能6G架构。接下来,开发了AI和信任管理的集成以优化情报和安全性。最后,提出的基于AI的信任管理方法用于确保聚类以实现可靠和实时的通信。仿真结果表明了其在保证网络安全和服务质量方面的出色性能。
translated by 谷歌翻译
LIDC-IDRI数据库是肺癌预测的最流行的基准。但是,通过放射科医生的主观评估,LIDC中的结节可能与病理基础真理具有完全不同的恶性注释,从而引入了标签分配错误,并在培训期间引起了后续的监督偏见。因此,LIDC数据库需要更多的客观标签来基于学习的癌症预测。基于一个额外的小数据集,该数据集包含通过病理检查诊断的180个结节,我们建议重新标记LIDC数据,以减轻对此强大基准测试的原始注释偏差的影响。我们在本文中证明,基于度量学习的类似结节检索提供新标签将是一种有效的重新标记策略。对这些重新标记的LIDC结节进行的培训可改善模型性能,当添加不确定的结节的新标签时,这将增强。我们进一步推断出,重新标记的LIDC是最终的良好肺癌预测的方便方法,同时构建大型病理预处理的结节数据库提供了长期解决方案。
translated by 谷歌翻译
特定的发射极识别(SEI)是物理层身份验证的高潜在技术,它是上层身份验证的最关键补充之一。 SEI基于电路差而不是密码学的射频(RF)特征。这些功能是硬件电路的固有特征,很难伪造。最近,已经提出了各种基于深度学习(DL)的常规SEI方法,并实现了高级性能。但是,提出了这些方法,用于使用大量的RF信号样品进行训练的近距离场景,并且在训练样品有限的情况下,它们的性能较差。因此,我们将重点放在几个射击SEI(FS-SEI)上,用于通过自动依赖的监视播(ADS-B)信号进行飞机识别,并根据深度度量集合学习(DMEL)提出了一种新颖的FS-SEI方法。具体而言,提出的方法包括特征嵌入和分类。前者基于具有复杂价值的卷积神经网络(CVCNN)的度量学习,用于提取具有紧凑的类别内距离和可分离类别间距离的区分特征,而后者则由集合分类器实现。仿真结果表明,如果每个类别的样本数量超过5,则我们提出的方法的平均准确性高于98 \%。此外,特征可视化证明了我们提出的方法在可区分性和概括方面的优势。本文的代码可以从GitHub(https://github.com/beechburgpiestar/few-shot-specific-emitter-emitter-istifification-via-deep-metric-metric-semble-learning)下载。
translated by 谷歌翻译
激光雷达语义分割的当前方法对于现实世界应用,例如自动驾驶,因为它是封闭式和静态的。封闭设置的假设使网络只能输出训练的类的标签,即使是从未见过的对象,而静态网络也无法根据所看到的知识来更新其知识库。因此,在这项工作中,我们提出了激光点云的开放世界语义细分任务,其目的是1)使用开放式语义分段确定旧类和新颖的类,以及2)逐渐将新颖对象纳入现有知识库中使用增量学习而不会忘记旧课程。为此,我们提出了一个冗余分类器(真实)框架,以为开放式语义细分和增量学习问题提供一般体系结构。实验结果表明,真实可以同时在Semantickitti和Nuscenes数据集中的开放式语义分割任务中实现最新性能,并在增量学习过程中减轻灾难性遗忘问题,并减少较大的利润率。
translated by 谷歌翻译
图形神经网络(GNN)在解决图形结构数据(即网络)方面的各种分析任务方面已广受欢迎。典型的gnns及其变体遵循一种消息的方式,该方式通过网络拓扑沿网络拓扑的特征传播过程获得网络表示,然而,它们忽略了许多现实世界网络中存在的丰富文本语义(例如,局部单词序列)。现有的文本丰富网络方法通过主要利用内部信息(例如主题或短语/单词)来整合文本语义,这些信息通常无法全面地挖掘文本语义,从而限制了网络结构和文本语义之间的相互指导。为了解决这些问题,我们提出了一个具有外部知识(TEKO)的新型文本富裕的图形神经网络,以充分利用文本丰富的网络中的结构和文本信息。具体而言,我们首先提出一个灵活的异质语义网络,该网络结合了文档和实体之间的高质量实体和互动。然后,我们介绍两种类型的外部知识,即结构化的三胞胎和非结构化实体描述,以更深入地了解文本语义。我们进一步为构建的异质语义网络设计了互惠卷积机制,使网络结构和文本语义能够相互协作并学习高级网络表示。在四个公共文本丰富的网络以及一个大规模的电子商务搜索数据集上进行了广泛的实验结果,这说明了Teko优于最先进的基线。
translated by 谷歌翻译
布局规划在建筑和城市设计领域非常重要。在携带城市功能的各种基本单元中,住宅社区对支持人类生活起着至关重要的作用。因此,自深度学习的出现以来,居住社区的布局规划一直引起人们的关注,并引起了人们的特别关注,从而促进了自动化的布局产生和空间模式识别。但是,研究圈通常会遭受住宅社区布局基准或高质量数据集的不足,这阻碍了对住宅社区布局计划的数据驱动方法的未来探索。数据集的缺乏很大程度上是由于大规模现实世界中的住宅数据获取和长期专家筛查的困难。为了解决这些问题并推进基准数据集,用于智能城市开发中各种智能的空间设计和分析应用迄今为止,现实世界中的社区。 RECO数据集以多种数据格式呈现,其中包含37,646个住宅社区布局计划,涵盖了598,728个带有高度信息的住宅建筑。可以方便地适应与住宅社区布局相关的城市设计任务,例如生成布局设计,形态模式识别和空间评估。为了验证自动化住宅社区布局计划中RECO的实用性,基于生成的对抗网络(GAN)的生成模型进一步应用于数据集。我们希望Reco数据集能够激发智能设计及其他方面的更具创造力和实用性的工作。 RECO数据集发表在以下网址:https://www.kaggle.com/fdudsde/reco-dataset。
translated by 谷歌翻译